AI资讯新闻榜单内容搜索-LLaMA 2

开源大模型王座再易主，1320亿参数DBRX上线，基础、微调模型都有

这是迄今为止最强大的开源大语言模型，超越了 Llama 2、Mistral 和马斯克刚刚开源的 Grok-1。

来自主题: AI技术研报

11278 点击 2024-03-28 14:26

6款通用大模型在保险行业的能力PK测评报告｜ZionAI实验室大模型测评

参照SuperCLUE（中文通用大模型综合性测评基准）框架专门定制了1000道题目集，一一测试了ChatGPT4、智谱chatGLM-4、Baichuan2-Turbo、百度ERNIE-Bot 4.0、Yi-34B-chat、llama 2等模型在保险业务上的表现。

来自主题: AI资讯

10042 点击 2024-03-07 10:34

DeepMind携Mamba华人作者推Transformer革命之作！性能暴涨媲美Llama 2，推理能效大幅碾压

线性RNN赢了？近日，谷歌DeepMind一口气推出两大新架构，在d基准测试中超越了Transformer。新架构不仅保证了高效的训练和推理速度，并且成功扩展到了14B。

来自主题: AI资讯

7366 点击 2024-03-04 15:15

DeepMind CEO Demis Hassabis 专访：2030年有望达到AGI、AI会带来革命性的全民普惠

Google 最近在大模型上动作不断，先是发布了性能更强大的多模态 Gemini 1.5 Pro，然后是开源的小模型 Gemma，评测结果超过了 7b 量级的 Llama 2。

来自主题: AI资讯

8494 点击 2024-03-02 10:53

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

2023 年我们正见证着多模态大模型的跨越式发展，多模态大语言模型（MLLM）已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。以 Llama 2，Mixtral 为代表的大语言模型（LLM），以 GPT-4、Gemini、LLaVA 为代表的多模态大语言模型跨越式发展。

来自主题: AI资讯

9603 点击 2024-03-01 13:47

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数规模急剧扩张而面临严峻的训练成本。

来自主题: AI技术研报

11044 点击 2024-02-04 13:59

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

在 AI 赛道中，与动辄上千亿参数的模型相比，最近，小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型，其在每个基准测试中，都优于 Llama 2 13B，并且在代码、数学和推理方面也优于 LLaMA 1 34B。

来自主题: AI技术研报

10817 点击 2024-02-02 11:50

Meta官方的Prompt工程指南：Llama 2这样用更高效

随着大型语言模型（LLM）技术日渐成熟，提示工程（Prompt Engineering）变得越来越重要。一些研究机构发布了 LLM 提示工程指南，包括微软、OpenAI 等等。

来自主题: AI技术研报

7307 点击 2024-01-29 12:36

Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LLM终局

AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法，让Llama2一举击败GPT-4 0613、Claude 2、Gemini Pro领先模型。

来自主题: AI技术研报

8909 点击 2024-01-22 10:34

英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大

昨天，Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天，英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下，在 10 个对话 QA 数据集上的平均得分略胜于 GPT-4。

来自主题: AI资讯

10764 点击 2024-01-21 14:27

AI资讯新闻榜单内容搜索-LLaMA 2

开源大模型王座再易主，1320亿参数DBRX上线，基础、微调模型都有

6款通用大模型在保险行业的能力PK测评报告 ｜ZionAI实验室大模型测评

DeepMind携Mamba华人作者推Transformer革命之作！性能暴涨媲美Llama 2，推理能效大幅碾压

DeepMind CEO Demis Hassabis 专访：2030年有望达到AGI、AI会带来革命性的全民普惠

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

Meta官方的Prompt工程指南：Llama 2这样用更高效

Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LLM终局

英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大

6款通用大模型在保险行业的能力PK测评报告｜ZionAI实验室大模型测评